Conception d'entrepôts de données géospatiales à partir de sources hétérogènes Exemple d'application en foresterie
نویسندگان
چکیده
RÉSUMÉ. Dans cet article, nous abordons les problèmes liés à l’intégration de données spatiotemporelles au sein d’un entrepôt de données. Dans de nombreux cas, les spécifications des jeux de données géospatiales évoluent et les données sont hétérogènes à la fois des points de vue temporel, spatial et sémantique. Afin d’explorer et d’analyser des jeux de données spatiotemporelles dans une application SOLAP (Spatial On-Line Analytical Processing), nous définissons les notions de dimension spatiale géométrique et de dimensions spécifiques ou génériques. A l’aide de ce type de dimensions, nous proposons deux approches pour modéliser des structures multidimensionnelles. L’objectif final est de permettre l’extraction de connaissances géographiques par l’exploration des données détaillées associées à une époque et des études temporelles sur les données intégrées et comparatives. A partir d’un exemple pris dans le domaine de la foresterie, nous évaluons l’implémentation de ces deux modèles. ABSTRACT. This paper presents some problems linked to the integration of data in a spatiotemporal data warehouse. In many cases, the specifications of the data sets have evolved over time and data sources have temporal, spatial and semantic heterogeneity. In order to explore and analyse spatio-temporal data sets in a SOLAP (Spatial On Line Analytical Processing) application, we define geometric spatial dimension and specific or generic thematic dimensions. Using these dimensions, we propose two approaches to model multidimensional structures. The final objective is to support geographic knowledge discovery through data exploration of detailed data for an epoch and of integrated comparable data for time-variant studies. Using a practical example in the field of forestry, we evaluate the implementation of these two models.
منابع مشابه
Approche géosémantique intégrée pour les cubes évolutifs de données géospatiales
RtSUMt. Da"s un contexte décisionnel, les bases de données géospatiales multidimensionnelles représentent souvem des données provenant de sources hétérogènes et évolutives. L'évolution de la Slnicture multidimensionnelle el de l'évolution du découpage spatial empêchent le lraitement des requêtes spaliotemporefles. en raison de l'absence de liens entre les cubes créés li différentes époques. Dan...
متن کاملDu XML au multidimensionnel : Conception de magasins de données
Résumé. Avec l’ouverture des entreprises sur l’Internet, les sources de données englobent davantage des données échangées avec les partenaires et/ou issues du Web. Dans ce cadre organisationnel ouvert, les documents XML constituent des sources de données plus utilisées aussi bien pour le stockage que pour les échanges transactionnels. Ce nouveau format de données a motivé des propositions de mo...
متن کاملIntégration de données hétérogènes basée sur la qualité
RÉSUMÉ. Les systèmes de médiation constituent une réponse architecturale pour un accès transparent à des sources de données distribuées. Cependant, leur mise en oeuvre pose un certain nombre de problèmes, tant en ce qui concerne la génération des liens sémantiques entre le schéma de médiation et les sources de données (requêtes de médiation) qu'en ce qui concerne l'adaptation de l'accès aux bes...
متن کاملGénération de RDF à partir de sources de données aux formats hétérogènes
Résumé. Contrairement à ce que promeut le Web des données, les données exposées par la plupart des organisations sont dans des formats non-RDF tels que CSV, JSON, ou XML. De plus sur le Web des objets, les objets contraints préféreront des formats binaires tels que EXI ou CBOR aux formats RDF textuels. Dans ce contexte, RDF peut toutefois servir de lingua franca pour l’interopérabilité sémantiq...
متن کاملStreet-Level Geolocation From Natural Language Descriptions
In this article, we describe the TEGUS system for mining geospatial path data from natural language descriptions. TEGUS uses natural language processing and geospatial databases to recover path coordinates from user descriptions of paths at street level. We also describe the PURSUIT Corpus — an annotated corpus of geospatial path descriptions in spoken natural language. PURSUIT includes the spo...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- Ingénierie des Systèmes d'Information
دوره 7 شماره
صفحات -
تاریخ انتشار 2002